智能论文笔记

A Hybrid Spatial-temporal Deep Learning Architecture for Lane Detection

Yongqi Dong , Sandeep Patil , Bart van Arem , Haneen Farah

分类：计算机视觉 | 人工智能 | 机器学习

2021-10-05

准确且可靠的车道检测对于巷道维护援助和车道出发警告系统的安全性能至关重要。但是，在某些具有挑战性的情况下，很难在当前文献中主要从一个图像中准确地检测到一个单一图像的车道时获得令人满意的性能。由于车道标记是连续线，因此如果合并了以前的帧信息，则可以在当前单个图像中准确检测到的车道可以更好地推导。这项研究提出了一种新型的混合时空（ST）序列到一个深度学习结构。该体系结构充分利用了多个连续图像帧中的ST信息，以检测最后一帧中的车道标记。具体而言，混合模型集成了以下方面：（a）配备了空间卷积神经网络的单个图像特征提取模块；（b）由ST复发神经网络构建的ST特征集成模块；（c）编码器解码器结构，该结构使此图像分割问题以端到端监督的学习格式起作用。广泛的实验表明，所提出的模型体系结构可以有效地处理具有挑战性的驾驶场景，并且优于可用的最先进方法。

translated by 谷歌翻译

Human Activity Recognition from Wi-Fi CSI Data Using Principal Component-Based Wavelet CNN

Ishtiaque Ahmed Showmik , Tahsina Farah Sanam , Hafiz Imtiaz

分类：计算机视觉 | 机器学习

2022-12-26

Human Activity Recognition (HAR) is an emerging technology with several applications in surveillance, security, and healthcare sectors. Noninvasive HAR systems based on Wi-Fi Channel State Information (CSI) signals can be developed leveraging the quick growth of ubiquitous Wi-Fi technologies, and the correlation between CSI dynamics and body motions. In this paper, we propose Principal Component-based Wavelet Convolutional Neural Network (or PCWCNN) -- a novel approach that offers robustness and efficiency for practical real-time applications. Our proposed method incorporates two efficient preprocessing algorithms -- the Principal Component Analysis (PCA) and the Discrete Wavelet Transform (DWT). We employ an adaptive activity segmentation algorithm that is accurate and computationally light. Additionally, we used the Wavelet CNN for classification, which is a deep convolutional network analogous to the well-studied ResNet and DenseNet networks. We empirically show that our proposed PCWCNN model performs very well on a real dataset, outperforming existing approaches.

translated by 谷歌翻译

Leveraging Artificial Intelligence Techniques for Smart Palm Tree Detection: A Decade Systematic Review

Yosra Hajjaji , Wadii Boulila , Imed Riadh Farah

分类：人工智能

2022-09-12

在过去的几年中，农业部门的总财务投资大大增加。棕榈树对许多国家的经济很重要，尤其是在北非和中东。在检测和计数棕榈树方面进行监测为各种利益相关者提供了有用的信息；它有助于产生估计和检查，以确保更好的农作物质量，并防止害虫，疾病，更好的灌溉和其他潜在威胁。尽管它们的重要性，但这些信息仍然具有挑战性。这项研究系统地回顾了2011年至2021年之间有关智能棕榈树检测技术的技术（AI）技术。使用基于四阶段选择过程的PRISMA方法进行系统审查（SR）。为了回答两个主要的研究问题，包括从搜索策略以及纳入标准以及两个主要研究标准的合成活动中纳入了22篇文章。该研究的发现揭示了过去十年中棕榈树检测中应用人工智能的模式，关系，网络和趋势。尽管大多数研究都取得了良好的结果，但大规模棕榈种植园的有效管理仍然是一个挑战。此外，其经济与智能棕榈服务密切相关的国家，尤其是在北非，应该更多地关注这类研究。这项研究的结果可以使研究界和利益相关者受益。

translated by 谷歌翻译

Neural network accelerator for quantum control

David Xu , A. Barış Özgüler , Giuseppe Di Guglielmo , Nhan Tran , Gabriel N. Perdue , Luca Carloni , Farah Fahim

分类：机器学习

2022-08-04

有效的量子控制对于使用当前技术的实用量子计算实施是必需的。用于确定最佳控制参数的常规算法在计算上是昂贵的，在很大程度上将它们排除在模拟之外。构成作为查找表的现有硬件解决方案不精确且昂贵。通过设计机器学习模型来近似传统工具的结果，可以生成更有效的方法。然后可以将这样的模型合成为硬件加速器以用于量子系统。在这项研究中，我们演示了一种用于预测最佳脉冲参数的机器学习算法。该算法的轻量级足以适合低资源FPGA，并以175 ns的延迟和管道间隔为5 ns，$〜>〜>〜$〜>〜$ 0.99。从长远来看，这种加速器可以在传统计算机无法运行的量子计算硬件附近使用，从而在低潜伏期以合理的成本实现量子控制，而不会在低温环境之外产生大型数据带宽。

translated by 谷歌翻译

MedFuse: Multi-modal fusion with clinical time-series data and chest X-ray images

Nasir Hayat , Krzysztof J. Geras , Farah E. Shamout

分类：计算机视觉 | 机器学习

2022-07-14

多模式融合方法旨在整合来自不同数据源的信息。与天然数据集不同，例如在视听应用中，样本由“配对”模式组成，医疗保健中的数据通常异步收集。因此，对于给定样品需要所有方式，对于临床任务而言并不现实，并且在训练过程中显着限制了数据集的大小。在本文中，我们提出了Medfuse，这是一种概念上简单但有前途的基于LSTM的融合模块，可以容纳Uni-Mododal和多模式输入。我们使用MIMIC-IV数据集中的临床时间序列数据以及Mimic-CXR中的相应的胸部X射线图像，评估了融合方法，并引入了院内死亡率预测和表型分类的新基准结果。与更复杂的多模式融合策略相比，MEDFUSE在完全配对的测试集上的差距很大。它在部分配对的测试集中还保持了强大的稳定性，其中包含带有缺少胸部X射线图像的样品。我们发布了我们的可重复性代码，并在将来对竞争模型进行评估。

translated by 谷歌翻译

Visual Place Representation and Recognition from Depth Images

Farah Ibelaiden , Slimane Larabi

分类：计算机视觉

2021-12-27

这项工作提出了一种基于场景架构的地点识别的新方法。从深度视频中，我们计算3D模型，我们派生和描述几何图中推导出场景描述符来构成所提出算法的核心的2D地图。所获得的结果表明，对场景外观变化和光变化的效率和鲁棒性。

translated by 谷歌翻译

Towards dynamic multi-modal phenotyping using chest radiographs and physiological data

Nasir Hayat , Krzysztof J. Geras , Farah E. Shamout

分类：计算机视觉 | 机器学习

2021-11-04

医疗领域的特征在于，不同种类的数据的模式，诸如成像和生理数据。在实践中，各种决策的医疗数据有助于临床医生。然而，目前大多数国家的最先进的深学习模式完全依赖一个单一的模式精心策划的数据。在本文中，我们提出了一个动态的培训方法，学习特定的模态数据表示和集成的辅助功能，而不是仅仅依靠一个单一的模式。我们的初步实验结果使用在MIMIC- CXR数据集表明，该方法实现了ROC曲线（AUROC）（0.764 AUROC）下的最高区域在MIMIC-IV胸片生理数据相比，患者的表型任务在先前的工作基准的方法，其中仅使用生理数据（AUROC 0.740）的性能。对于重复一组五个或周期性急性发作，包括心律失常，传导障碍，和充血性心脏衰竭的慢性疾病中，AUROC改善了从0.747至0.798。这说明利用在表型任务胸部成像方式的好处，并强调在医疗应用多模态学习的潜能。

translated by 谷歌翻译